新電子雜誌 » 熱門新聞 » NVIDIA強化GPU/雲端算力　雙向布局HPC

NVIDIA強化GPU/雲端算力　雙向布局HPC

作者：吳心予

2022 年 11 月 10 日

高效能運算(HPC)及雲端服務是支援人工智慧(AI)發展的重要技術，對此，NVIDIA透過採用Transformer引擎及Hopper架構，強化A100 GPU效能，用以運算大型AI模型。同時NVIDIA為Rescale雲端平台提供AI軟體，為其高效能運算即服務(HPC-as-a-service)產品帶來新功能，同時加速Rescale運算推薦引擎(Rescale Compute Recommendation Engine)的執行速度。

A100 GPU運算效能加倍

日前NVIDIA宣布在MLPerf相關基準測試中，NVIDIA A100 Tensor核心GPU提高了2021年在HPC立下的標準。H100 GPU採用Hopper架構，提高了 MLPerf 訓練中單一加速器的效能標準，在首次將H100 GPU用於 MLPerf 訓練時，表現相較前一代 GPU高6.7倍的效能(圖1)。

加上以同樣的比較基礎來看，由於軟體的進步，目前A100 GPU的運算能力又高出2.5倍。效能大幅提升的原因之一是Transformer引擎，Hopper架構在訓練用於自然語言處理的BERT模型時有良好的表現。BERT是MLPerf AI模型中規模較大、對處理效能要求較為嚴苛的模型之一。

圖1　NVIDIA H100 GPU首次提交 MLPerf訓練成績時，速度比A100 GPU快6.7倍　(資料來源：NVIDIA)

在獨立的MLPerf HPC基準測試，在超級電腦上運行嚴苛的科學作業負載時，A100 GPU在 AI 訓練模型所有測試項目中的表現良好。例如A100 GPU在 CosmoFlow測試中訓練AI模型，比兩年前第一輪MLPerf HPC測試的最佳結果還快9倍。在同樣的作業負載中，A100的每個晶片處理量亦比其他產品高66倍。HPC基準是用於天體物理學、天氣預測及分子動力學的工作訓練模型，藥物開發等許多技術領域同樣採用AI來推動科學發展(圖2)。

圖2　在全球的測試中，A100 GPU 在訓練速度與處理量都具有良好的表現　(資料來源：NVIDIA)

在企業 AI訓練基準測試方面，包括Microsoft Azure雲端服務在內的11個公司使用NVIDIA A100、A30 和 A40 GPU提交測試結果。華碩(ASUS)、戴爾科技、富士通(Fujitsu)、技嘉(GIGABYTE)、慧與科技(Hewlett Packard Enterprise)、聯想(Lenovo)及美超微(Supermicro)等系統製造商，共使用九套 NVIDIA 認證系統提交測試結果。

在最新一輪的測試中，至少有三家公司與NVIDIA一樣提交所有MLPerf訓練作業負載的八項測試結果。真實環境中的應用程式往往需要一套涵蓋多種AI模型的方案，因此通用性更顯重要。NVIDIA的合作夥伴認為客戶會使用MLPerf工具來評估AI平台和供應商，因此參與MLPerf基準測試。

AI軟體強化Rescale雲端平台服務

工業科學運算領域容易在資料處理效能方面卡關，因為若要解決看似棘手的難題需要用到大量的高效能運算資源，無論是開發新能源、創造新的運輸模式，或是解決提高營運效率及改善客戶支援等重大問題皆如此。包含伊萊克斯(Electrolux)、電裝(Denso)、三星(Samsung) 和維珍軌道(Virgin Orbit)等企業皆捨棄架構、設計和打造更多的超級電腦，轉而採用Rescale雲端平台，期望以節能的方式擴大加速運算的規模並加速創新。

Rescale將採用NVIDIA AI軟體產品組合，以滿足工業科學領域對雲端AI不斷增加的運算需求。NVIDIA AI將為Rescale的HPC-as-a-service產品帶來新功能，包括各產業廠商使用的模擬與工程設計軟體。NVIDIA協助加速甫推出的Rescale運算推薦引擎的執行速度，客戶可以使用該引擎找出正確的基礎設施選項，最佳化部署的成本與加速落實各項目標。

NVIDIA與Rescale宣布致力於將NVIDIA AI Enterprise導入Rescale，再加入以NVIDIA支援的AI工作流程和處理引擎，擴大雲端平台的產品選擇。待正式推出後，客戶便能在NVIDIA的支援下，於各大雲端環境中開發AI應用程式。企業可以利用NVIDIA AI平台開發預測模型，藉由機器視覺、路線和供應鏈最佳化、機器人模擬等應用程式，互補並擴充工業高效能運算的研發工作。

標籤

近期研討會 More

2025-03-11 【實體活動】3月11日深化AI轉型加速虛實整合

白皮書

Cookie	Duration	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

TPCA：川普2.0來勢洶洶 PCB產業面臨新局面

Meta首席AI科學家Yann LeCun：AI架構新典範5年內到來

繁中生成式AI落地 AI Labs產業年會探討台灣優勢

工研院/台達電聯合發表車用驅動碳化矽功率模組

愛立信：中頻段/5G SA密集化部署 實現差異化服務/奠定6G基礎

台寬能隙半導體供應鏈成型 碳化矽/氮化鎵雙軌發展

想定偏誤或過早布局？ 純推論晶片面臨轉型壓力(1)

想定偏誤或過早布局？ 純推論晶片面臨轉型壓力(2)

台灣智能機器人科技總經理黃國聰：瞄準專用服務型機器人藍海

MCU結合微型AI 智慧應用深入製造現場(1)

SGP4模型家族結合ML 衛星位置估算要快/要準任君選

UNO R3或R4？好難決定！兩款開發板選擇指南，幫專案找出最適配開發板

高密度電源需求大增 Si/SiC/GaN元件特性各有千秋

滿足嵌入式應用特殊需求 eUSB2V2標準問世

覆晶封裝導入銅柱技術 可靠度評估不可輕忽

半固態電池裝車輛緩步上升 2027年滲透率突破1%

高階自駕、物流需求帶動 光達產值2029年達53.52億美元

Windows換機潮/AI PC聯手拉抬 2024年PC出貨量小幅成長

Counterpoint：2024年全自駕車大有斬獲 Tesla將重塑市場格局

TrendForce：2030年Level3自駕電動車款占比將達10%

博世回顧2024財務年度/推進2030年策略目標

7layers/Rohde & Schwarz推出首個藍牙射頻通道探測測試解決方案

英飛凌發布2025會計年度第一季營運成果

雃博選用安立知物聯網無線傳輸測試技術

意法半導體公布2024年第四季/全年財報

NVIDIA強化GPU/雲端算力 雙向布局HPC

A100 GPU運算效能加倍

AI軟體強化Rescale雲端平台服務

NVIDIA發表A100 80GB GPU 建構下世代超級電腦

高速運算向前衝 NVIDIA Quantum-2/Jetson AGX Orin亮相

NERSC超級電腦Perlmutter搭載6000個NVIDIA A100 GPU

處理器廠力捧 USB 3.0走紅UHD市場

GPU模型推論效能升級 邊緣運算裝置AI更強大

RTX AI PC亮相 黃仁勳：數位人類應用可期

【經典秘笈下載】電源監控器處理延長電池壽命並提高性能

【工程師必備收藏】SiC引領能源新革命: 高效儲能與轉換系統設計指南

【免費下載】解鎖未來智慧車關鍵議題！免費下載《AI智慧車與智慧座艙》白皮書

【成功案例分享】即刻下載！ROHM使用Siemens Tanner提供一流的dual MOSFET元件

【熱門白皮書】快來下載！類比混合訊號驗證方法論

Silicon Labs亞太區暨日本業務副總裁王祿銘：2025物聯網/邊緣AI深度結合創新局

ams OSRAM Rest of Asia技術行銷總監李定翰：光與AI融合深化感測技術/應用

Qorvo資深產品行銷經理陳慶鴻：高整合/低電壓射頻前端再進化

以研發實力為根基 搭配國際策略合作 WAFERLOCK維夫拉克 插旗服務型機器人市場

MIPS執行長Sameer Wasson：微架構才是CPU的護城河

博世回顧2024財務年度/推進2030年策略目標

英飛凌發布2025會計年度第一季營運成果

7layers/Rohde & Schwarz推出首個藍牙射頻通道探測測試解決方案

半固態電池裝車輛緩步上升 2027年滲透率突破1%

雃博選用安立知物聯網無線傳輸測試技術

TPCA：川普2.0來勢洶洶 PCB產業面臨新局面

想定偏誤或過早布局？ 純推論晶片面臨轉型壓力(1)

Meta首席AI科學家Yann LeCun：AI架構新典範5年內到來

MCU結合微型AI 智慧應用深入製造現場(1)

滿足嵌入式應用特殊需求 eUSB2V2標準問世

TPCA：川普2.0來勢洶洶　PCB產業面臨新局面

繁中生成式AI落地　AI Labs產業年會探討台灣優勢

愛立信：中頻段/5G SA密集化部署　實現差異化服務/奠定6G基礎

台寬能隙半導體供應鏈成型　碳化矽/氮化鎵雙軌發展

想定偏誤或過早布局？　純推論晶片面臨轉型壓力(1)

想定偏誤或過早布局？　純推論晶片面臨轉型壓力(2)

MCU結合微型AI　智慧應用深入製造現場(1)

SGP4模型家族結合ML　衛星位置估算要快/要準任君選

高密度電源需求大增　Si/SiC/GaN元件特性各有千秋

滿足嵌入式應用特殊需求　eUSB2V2標準問世

覆晶封裝導入銅柱技術　可靠度評估不可輕忽

半固態電池裝車輛緩步上升　2027年滲透率突破1%

高階自駕、物流需求帶動　光達產值2029年達53.52億美元

Windows換機潮/AI PC聯手拉抬　2024年PC出貨量小幅成長

Counterpoint：2024年全自駕車大有斬獲　Tesla將重塑市場格局

NVIDIA強化GPU/雲端算力　雙向布局HPC

NVIDIA發表A100 80GB GPU　建構下世代超級電腦

高速運算向前衝　NVIDIA Quantum-2/Jetson AGX Orin亮相

處理器廠力捧　USB 3.0走紅UHD市場

GPU模型推論效能升級　邊緣運算裝置AI更強大

RTX AI PC亮相　黃仁勳：數位人類應用可期

以研發實力為根基　搭配國際策略合作　WAFERLOCK維夫拉克插旗服務型機器人市場

半固態電池裝車輛緩步上升　2027年滲透率突破1%

TPCA：川普2.0來勢洶洶　PCB產業面臨新局面

想定偏誤或過早布局？　純推論晶片面臨轉型壓力(1)

MCU結合微型AI　智慧應用深入製造現場(1)

滿足嵌入式應用特殊需求　eUSB2V2標準問世